home *** CD-ROM | disk | FTP | other *** search
/ CU Amiga Super CD-ROM 21 / CU Amiga Magazine's Super CD-ROM 21 (1998)(EMAP Images)(GB)[!][issue 1998-04].iso / CUCD / Programming / Python-1.4 / Python1.4_Source / Modules / binascii.c < prev    next >
C/C++ Source or Header  |  1996-12-15  |  24KB  |  764 lines

  1. /***********************************************************
  2. Copyright 1991, 1992, 1993, 1994 by Stichting Mathematisch Centrum,
  3. Amsterdam, The Netherlands.
  4.  
  5.                         All Rights Reserved
  6.  
  7. Permission to use, copy, modify, and distribute this software and its
  8. documentation for any purpose and without fee is hereby granted,
  9. provided that the above copyright notice appear in all copies and that
  10. both that copyright notice and this permission notice appear in
  11. supporting documentation, and that the names of Stichting Mathematisch
  12. Centrum or CWI or Corporation for National Research Initiatives or
  13. CNRI not be used in advertising or publicity pertaining to
  14. distribution of the software without specific, written prior
  15. permission.
  16.  
  17. While CWI is the initial source for this software, a modified version
  18. is made available by the Corporation for National Research Initiatives
  19. (CNRI) at the Internet address ftp://ftp.python.org.
  20.  
  21. STICHTING MATHEMATISCH CENTRUM AND CNRI DISCLAIM ALL WARRANTIES WITH
  22. REGARD TO THIS SOFTWARE, INCLUDING ALL IMPLIED WARRANTIES OF
  23. MERCHANTABILITY AND FITNESS, IN NO EVENT SHALL STICHTING MATHEMATISCH
  24. CENTRUM OR CNRI BE LIABLE FOR ANY SPECIAL, INDIRECT OR CONSEQUENTIAL
  25. DAMAGES OR ANY DAMAGES WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR
  26. PROFITS, WHETHER IN AN ACTION OF CONTRACT, NEGLIGENCE OR OTHER
  27. TORTIOUS ACTION, ARISING OUT OF OR IN CONNECTION WITH THE USE OR
  28. PERFORMANCE OF THIS SOFTWARE.
  29.  
  30. ******************************************************************/
  31.  
  32. /*
  33. ** Routines to represent binary data in ASCII and vice-versa
  34. **
  35. ** This module currently supports the following encodings:
  36. ** uuencode:
  37. **         each line encodes 45 bytes (except possibly the last)
  38. **    First char encodes (binary) length, rest data
  39. **    each char encodes 6 bits, as follows:
  40. **    binary: 01234567 abcdefgh ijklmnop
  41. **    ascii:  012345 67abcd efghij klmnop
  42. **    ASCII encoding method is "excess-space": 000000 is encoded as ' ', etc.
  43. **    short binary data is zero-extended (so the bits are always in the
  44. **    right place), this does *not* reflect in the length.
  45. ** base64:
  46. **      Line breaks are insignificant, but lines are at most 76 chars
  47. **      each char encodes 6 bits, in similar order as uucode/hqx. Encoding
  48. **      is done via a table.
  49. **      Short binary data is filled (in ASCII) with '='.
  50. ** hqx:
  51. **    File starts with introductory text, real data starts and ends
  52. **    with colons.
  53. **    Data consists of three similar parts: info, datafork, resourcefork.
  54. **    Each part is protected (at the end) with a 16-bit crc
  55. **    The binary data is run-length encoded, and then ascii-fied:
  56. **    binary: 01234567 abcdefgh ijklmnop
  57. **    ascii:  012345 67abcd efghij klmnop
  58. **    ASCII encoding is table-driven, see the code.
  59. **    Short binary data results in the runt ascii-byte being output with
  60. **    the bits in the right place.
  61. **
  62. ** While I was reading dozens of programs that encode or decode the formats
  63. ** here (documentation? hihi:-) I have formulated Jansen's Observation:
  64. **
  65. **    Programs that encode binary data in ASCII are written in
  66. **    such a style that they are as unreadable as possible. Devices used
  67. **    include unnecessary global variables, burying important tables
  68. **    in unrelated sourcefiles, putting functions in include files,
  69. **    using seemingly-descriptive variable names for different purposes,
  70. **    calls to empty subroutines and a host of others.
  71. **
  72. ** I have attempted to break with this tradition, but I guess that that
  73. ** does make the performance sub-optimal. Oh well, too bad...
  74. **
  75. ** Jack Jansen, CWI, July 1995.
  76. */
  77.  
  78.  
  79. #include "Python.h"
  80.  
  81. #include "protos/binascii_protos.h"
  82.  
  83. static PyObject *Error;
  84. static PyObject *Incomplete;
  85.  
  86. /*
  87. ** hqx lookup table, ascii->binary.
  88. */
  89.  
  90. #define RUNCHAR 0x90
  91.  
  92. #define DONE 0x7F
  93. #define SKIP 0x7E
  94. #define FAIL 0x7D
  95.  
  96. static unsigned char table_a2b_hqx[256] = {
  97. /*       ^@    ^A    ^B    ^C    ^D    ^E    ^F    ^G   */
  98. /* 0*/    FAIL, FAIL, FAIL, FAIL, FAIL, FAIL, FAIL, FAIL,
  99. /*       \b    \t    \n    ^K    ^L    \r    ^N    ^O   */
  100. /* 1*/    FAIL, FAIL, SKIP, FAIL, FAIL, SKIP, FAIL, FAIL,
  101. /*       ^P    ^Q    ^R    ^S    ^T    ^U    ^V    ^W   */
  102. /* 2*/    FAIL, FAIL, FAIL, FAIL, FAIL, FAIL, FAIL, FAIL,
  103. /*       ^X    ^Y    ^Z    ^[    ^\    ^]    ^^    ^_   */
  104. /* 3*/    FAIL, FAIL, FAIL, FAIL, FAIL, FAIL, FAIL, FAIL,
  105. /*              !     "     #     $     %     &     '   */
  106. /* 4*/    FAIL, 0x00, 0x01, 0x02, 0x03, 0x04, 0x05, 0x06,
  107. /*        (     )     *     +     ,     -     .     /   */
  108. /* 5*/    0x07, 0x08, 0x09, 0x0A, 0x0B, 0x0C, FAIL, FAIL,
  109. /*        0     1     2     3     4     5     6     7   */
  110. /* 6*/    0x0D, 0x0E, 0x0F, 0x10, 0x11, 0x12, 0x13, FAIL,
  111. /*        8     9     :     ;     <     =     >     ?   */
  112. /* 7*/    0x14, 0x15, DONE, FAIL, FAIL, FAIL, FAIL, FAIL,
  113. /*        @     A     B     C     D     E     F     G   */
  114. /* 8*/    0x16, 0x17, 0x18, 0x19, 0x1A, 0x1B, 0x1C, 0x1D,
  115. /*        H     I     J     K     L     M     N     O   */
  116. /* 9*/    0x1E, 0x1F, 0x20, 0x21, 0x22, 0x23, 0x24, FAIL,
  117. /*        P     Q     R     S     T     U     V     W   */
  118. /*10*/    0x25, 0x26, 0x27, 0x28, 0x29, 0x2A, 0x2B, FAIL,
  119. /*        X     Y     Z     [     \     ]     ^     _   */
  120. /*11*/    0x2C, 0x2D, 0x2E, 0x2F, FAIL, FAIL, FAIL, FAIL,
  121. /*        `     a     b     c     d     e     f     g   */
  122. /*12*/    0x30, 0x31, 0x32, 0x33, 0x34, 0x35, 0x36, FAIL,
  123. /*        h     i     j     k     l     m     n     o   */
  124. /*13*/    0x37, 0x38, 0x39, 0x3A, 0x3B, 0x3C, FAIL, FAIL,
  125. /*        p     q     r     s     t     u     v     w   */
  126. /*14*/    0x3D, 0x3E, 0x3F, FAIL, FAIL, FAIL, FAIL, FAIL,
  127. /*        x     y     z     {     |     }     ~    ^?   */
  128. /*15*/    FAIL, FAIL, FAIL, FAIL, FAIL, FAIL, FAIL, FAIL,
  129. /*16*/    FAIL, FAIL, FAIL, FAIL, FAIL, FAIL, FAIL, FAIL,
  130.     FAIL, FAIL, FAIL, FAIL, FAIL, FAIL, FAIL, FAIL,
  131.     FAIL, FAIL, FAIL, FAIL, FAIL, FAIL, FAIL, FAIL,
  132.     FAIL, FAIL, FAIL, FAIL, FAIL, FAIL, FAIL, FAIL,
  133.     FAIL, FAIL, FAIL, FAIL, FAIL, FAIL, FAIL, FAIL,
  134.     FAIL, FAIL, FAIL, FAIL, FAIL, FAIL, FAIL, FAIL,
  135.     FAIL, FAIL, FAIL, FAIL, FAIL, FAIL, FAIL, FAIL,
  136.     FAIL, FAIL, FAIL, FAIL, FAIL, FAIL, FAIL, FAIL,
  137.     FAIL, FAIL, FAIL, FAIL, FAIL, FAIL, FAIL, FAIL,
  138.     FAIL, FAIL, FAIL, FAIL, FAIL, FAIL, FAIL, FAIL,
  139.     FAIL, FAIL, FAIL, FAIL, FAIL, FAIL, FAIL, FAIL,
  140.     FAIL, FAIL, FAIL, FAIL, FAIL, FAIL, FAIL, FAIL,
  141.     FAIL, FAIL, FAIL, FAIL, FAIL, FAIL, FAIL, FAIL,
  142.     FAIL, FAIL, FAIL, FAIL, FAIL, FAIL, FAIL, FAIL,
  143.     FAIL, FAIL, FAIL, FAIL, FAIL, FAIL, FAIL, FAIL,
  144.     FAIL, FAIL, FAIL, FAIL, FAIL, FAIL, FAIL, FAIL,
  145. };
  146.  
  147. static unsigned char table_b2a_hqx[] =
  148.     "!\"#$%&'()*+,-012345689@ABCDEFGHIJKLMNPQRSTUVXYZ[`abcdefhijklmpqr";
  149.  
  150. static char table_a2b_base64[] = {
  151. #ifdef __UNSIGNED_CHAR__
  152.     255,255,255,255, 255,255,255,255, 255,255,255,255, 255,255,255,255,
  153.     255,255,255,255, 255,255,255,255, 255,255,255,255, 255,255,255,255,
  154.     255,255,255,255, 255,255,255,255, 255,255,255,62, 255,255,255,63,
  155.     52,53,54,55, 56,57,58,59, 60,61,255,255, 255, 0,255,255, /* Note PAD->0 */
  156.     255, 0, 1, 2,  3, 4, 5, 6,  7, 8, 9,10, 11,12,13,14,
  157.     15,16,17,18, 19,20,21,22, 23,24,25,255, 255,255,255,255,
  158.     255,26,27,28, 29,30,31,32, 33,34,35,36, 37,38,39,40,
  159.     41,42,43,44, 45,46,47,48, 49,50,51,255, 255,255,255,255
  160. #else
  161.     -1,-1,-1,-1, -1,-1,-1,-1, -1,-1,-1,-1, -1,-1,-1,-1,
  162.     -1,-1,-1,-1, -1,-1,-1,-1, -1,-1,-1,-1, -1,-1,-1,-1,
  163.     -1,-1,-1,-1, -1,-1,-1,-1, -1,-1,-1,62, -1,-1,-1,63,
  164.     52,53,54,55, 56,57,58,59, 60,61,-1,-1, -1, 0,-1,-1, /* Note PAD->0 */
  165.     -1, 0, 1, 2,  3, 4, 5, 6,  7, 8, 9,10, 11,12,13,14,
  166.     15,16,17,18, 19,20,21,22, 23,24,25,-1, -1,-1,-1,-1,
  167.     -1,26,27,28, 29,30,31,32, 33,34,35,36, 37,38,39,40,
  168.     41,42,43,44, 45,46,47,48, 49,50,51,-1, -1,-1,-1,-1
  169. #endif
  170. };
  171.  
  172. #define BASE64_PAD '='
  173. #define BASE64_MAXBIN 57    /* Max binary chunk size (76 char line) */
  174.  
  175. static unsigned char table_b2a_base64[] =
  176.     "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/";
  177.  
  178.  
  179.  
  180. static unsigned short crctab_hqx[256] = {
  181.     0x0000, 0x1021, 0x2042, 0x3063, 0x4084, 0x50a5, 0x60c6, 0x70e7,
  182.     0x8108, 0x9129, 0xa14a, 0xb16b, 0xc18c, 0xd1ad, 0xe1ce, 0xf1ef,
  183.     0x1231, 0x0210, 0x3273, 0x2252, 0x52b5, 0x4294, 0x72f7, 0x62d6,
  184.     0x9339, 0x8318, 0xb37b, 0xa35a, 0xd3bd, 0xc39c, 0xf3ff, 0xe3de,
  185.     0x2462, 0x3443, 0x0420, 0x1401, 0x64e6, 0x74c7, 0x44a4, 0x5485,
  186.     0xa56a, 0xb54b, 0x8528, 0x9509, 0xe5ee, 0xf5cf, 0xc5ac, 0xd58d,
  187.     0x3653, 0x2672, 0x1611, 0x0630, 0x76d7, 0x66f6, 0x5695, 0x46b4,
  188.     0xb75b, 0xa77a, 0x9719, 0x8738, 0xf7df, 0xe7fe, 0xd79d, 0xc7bc,
  189.     0x48c4, 0x58e5, 0x6886, 0x78a7, 0x0840, 0x1861, 0x2802, 0x3823,
  190.     0xc9cc, 0xd9ed, 0xe98e, 0xf9af, 0x8948, 0x9969, 0xa90a, 0xb92b,
  191.     0x5af5, 0x4ad4, 0x7ab7, 0x6a96, 0x1a71, 0x0a50, 0x3a33, 0x2a12,
  192.     0xdbfd, 0xcbdc, 0xfbbf, 0xeb9e, 0x9b79, 0x8b58, 0xbb3b, 0xab1a,
  193.     0x6ca6, 0x7c87, 0x4ce4, 0x5cc5, 0x2c22, 0x3c03, 0x0c60, 0x1c41,
  194.     0xedae, 0xfd8f, 0xcdec, 0xddcd, 0xad2a, 0xbd0b, 0x8d68, 0x9d49,
  195.     0x7e97, 0x6eb6, 0x5ed5, 0x4ef4, 0x3e13, 0x2e32, 0x1e51, 0x0e70,
  196.     0xff9f, 0xefbe, 0xdfdd, 0xcffc, 0xbf1b, 0xaf3a, 0x9f59, 0x8f78,
  197.     0x9188, 0x81a9, 0xb1ca, 0xa1eb, 0xd10c, 0xc12d, 0xf14e, 0xe16f,
  198.     0x1080, 0x00a1, 0x30c2, 0x20e3, 0x5004, 0x4025, 0x7046, 0x6067,
  199.     0x83b9, 0x9398, 0xa3fb, 0xb3da, 0xc33d, 0xd31c, 0xe37f, 0xf35e,
  200.     0x02b1, 0x1290, 0x22f3, 0x32d2, 0x4235, 0x5214, 0x6277, 0x7256,
  201.     0xb5ea, 0xa5cb, 0x95a8, 0x8589, 0xf56e, 0xe54f, 0xd52c, 0xc50d,
  202.     0x34e2, 0x24c3, 0x14a0, 0x0481, 0x7466, 0x6447, 0x5424, 0x4405,
  203.     0xa7db, 0xb7fa, 0x8799, 0x97b8, 0xe75f, 0xf77e, 0xc71d, 0xd73c,
  204.     0x26d3, 0x36f2, 0x0691, 0x16b0, 0x6657, 0x7676, 0x4615, 0x5634,
  205.     0xd94c, 0xc96d, 0xf90e, 0xe92f, 0x99c8, 0x89e9, 0xb98a, 0xa9ab,
  206.     0x5844, 0x4865, 0x7806, 0x6827, 0x18c0, 0x08e1, 0x3882, 0x28a3,
  207.     0xcb7d, 0xdb5c, 0xeb3f, 0xfb1e, 0x8bf9, 0x9bd8, 0xabbb, 0xbb9a,
  208.     0x4a75, 0x5a54, 0x6a37, 0x7a16, 0x0af1, 0x1ad0, 0x2ab3, 0x3a92,
  209.     0xfd2e, 0xed0f, 0xdd6c, 0xcd4d, 0xbdaa, 0xad8b, 0x9de8, 0x8dc9,
  210.     0x7c26, 0x6c07, 0x5c64, 0x4c45, 0x3ca2, 0x2c83, 0x1ce0, 0x0cc1,
  211.     0xef1f, 0xff3e, 0xcf5d, 0xdf7c, 0xaf9b, 0xbfba, 0x8fd9, 0x9ff8,
  212.     0x6e17, 0x7e36, 0x4e55, 0x5e74, 0x2e93, 0x3eb2, 0x0ed1, 0x1ef0,
  213. };
  214.  
  215. static char doc_a2b_uu[] = "(ascii) -> bin. Decode a line of uuencoded data";
  216.  
  217. static PyObject *
  218. binascii_a2b_uu(self, args)
  219.     PyObject *self;
  220.     PyObject *args;
  221. {
  222.     unsigned char *ascii_data, *bin_data;
  223.     int leftbits = 0;
  224.     unsigned char this_ch;
  225.     unsigned int leftchar = 0;
  226.     PyObject *rv;
  227.     int ascii_len, bin_len;
  228.     
  229.     if ( !PyArg_ParseTuple(args, "s#", &ascii_data, &ascii_len) )
  230.         return NULL;
  231.  
  232.     /* First byte: binary data length (in bytes) */
  233.     bin_len = (*ascii_data++ - ' ') & 077;
  234.     ascii_len--;
  235.  
  236.     /* Allocate the buffer */
  237.     if ( (rv=PyString_FromStringAndSize(NULL, bin_len)) == NULL )
  238.         return NULL;
  239.     bin_data = (unsigned char *)PyString_AsString(rv);
  240.     
  241.     for( ; bin_len > 0 ; ascii_len--, ascii_data++ ) {
  242.         this_ch = *ascii_data;
  243.         if ( this_ch == '\n' || this_ch == '\r' || ascii_len <= 0) {
  244.             /*
  245.             ** Whitespace. Assume some spaces got eaten at
  246.             ** end-of-line. (We check this later)
  247.             */
  248.             this_ch = 0;
  249.             } else {
  250.             /* Check the character for legality
  251.             ** The 64 in stead of the expected 63 is because there are a few
  252.             ** uuencodes out there that use '@' as zero in stead of space.
  253.             */
  254.             if ( this_ch < ' ' || this_ch > (' ' + 64)) {
  255.                 PyErr_SetString(Error, "Illegal char");
  256.                 Py_DECREF(rv);
  257.                 return NULL;
  258.             }
  259.             this_ch = (this_ch - ' ') & 077;
  260.         }
  261.         /*
  262.         ** Shift it in on the low end, and see if there's
  263.         ** a byte ready for output.
  264.         */
  265.         leftchar = (leftchar << 6) | (this_ch);
  266.         leftbits += 6;
  267.         if ( leftbits >= 8 ) {
  268.             leftbits -= 8;
  269.             *bin_data++ = (leftchar >> leftbits) & 0xff;
  270.             leftchar &= ((1 << leftbits) - 1);
  271.             bin_len--;
  272.         }
  273.     }
  274.     /*
  275.     ** Finally, check that if there's anything left on the line
  276.     ** that it's whitespace only.
  277.     */
  278.     while( ascii_len-- > 0 ) {
  279.         this_ch = *ascii_data++;
  280.         if ( this_ch != ' ' && this_ch != '\n' && this_ch != '\r' ) {
  281.             PyErr_SetString(Error, "Trailing garbage");
  282.             Py_DECREF(rv);
  283.             return NULL;
  284.         }
  285.     }
  286.     return rv;
  287. }
  288.  
  289. static char doc_b2a_uu[] = "(bin) -> ascii. Uuencode line of data";
  290.     
  291. static PyObject *
  292. binascii_b2a_uu(self, args)
  293.     PyObject *self;
  294.     PyObject *args;
  295. {
  296.     unsigned char *ascii_data, *bin_data;
  297.     int leftbits = 0;
  298.     unsigned char this_ch;
  299.     unsigned int leftchar = 0;
  300.     PyObject *rv;
  301.     int bin_len;
  302.     
  303.     if ( !PyArg_ParseTuple(args, "s#", &bin_data, &bin_len) )
  304.         return NULL;
  305.     if ( bin_len > 45 ) {
  306.         /* The 45 is a limit that appears in all uuencode's */
  307.         PyErr_SetString(Error, "At most 45 bytes at once");
  308.         return NULL;
  309.     }
  310.  
  311.     /* We're lazy and allocate to much (fixed up later) */
  312.     if ( (rv=PyString_FromStringAndSize(NULL, bin_len*2)) == NULL )
  313.         return NULL;
  314.     ascii_data = (unsigned char *)PyString_AsString(rv);
  315.  
  316.     /* Store the length */
  317.     *ascii_data++ = ' ' + (bin_len & 077);
  318.     
  319.     for( ; bin_len > 0 || leftbits != 0 ; bin_len--, bin_data++ ) {
  320.         /* Shift the data (or padding) into our buffer */
  321.         if ( bin_len > 0 )    /* Data */
  322.             leftchar = (leftchar << 8) | *bin_data;
  323.         else            /* Padding */
  324.             leftchar <<= 8;
  325.         leftbits += 8;
  326.  
  327.         /* See if there are 6-bit groups ready */
  328.         while ( leftbits >= 6 ) {
  329.             this_ch = (leftchar >> (leftbits-6)) & 0x3f;
  330.             leftbits -= 6;
  331.             *ascii_data++ = this_ch + ' ';
  332.         }
  333.     }
  334.     *ascii_data++ = '\n';    /* Append a courtesy newline */
  335.     
  336.     _PyString_Resize(&rv, (ascii_data - (unsigned char *)PyString_AsString(rv)));
  337.     return rv;
  338. }
  339.  
  340. static char doc_a2b_base64[] = "(ascii) -> bin. Decode a line of base64 data";
  341.  
  342. static PyObject *
  343. binascii_a2b_base64(self, args)
  344.     PyObject *self;
  345.     PyObject *args;
  346. {
  347.     unsigned char *ascii_data, *bin_data;
  348.     int leftbits = 0;
  349.     unsigned char this_ch;
  350.     unsigned int leftchar = 0;
  351.     int npad = 0;
  352.     PyObject *rv;
  353.     int ascii_len, bin_len;
  354.     
  355.     if ( !PyArg_ParseTuple(args, "s#", &ascii_data, &ascii_len) )
  356.         return NULL;
  357.  
  358.     bin_len = ((ascii_len+3)/4)*3; /* Upper bound, corrected later */
  359.  
  360.     /* Allocate the buffer */
  361.     if ( (rv=PyString_FromStringAndSize(NULL, bin_len)) == NULL )
  362.         return NULL;
  363.     bin_data = (unsigned char *)PyString_AsString(rv);
  364.     bin_len = 0;
  365.     for( ; ascii_len > 0 ; ascii_len--, ascii_data++ ) {
  366.         /* Skip some punctuation */
  367.         this_ch = (*ascii_data & 0x7f);
  368.         if ( this_ch == '\r' || this_ch == '\n' || this_ch == ' ' )
  369.             continue;
  370.         
  371.         if ( this_ch == BASE64_PAD )
  372.             npad++;
  373.         this_ch = table_a2b_base64[(*ascii_data) & 0x7f];
  374.         if ( this_ch == (unsigned char) -1 ) continue;
  375.         /*
  376.         ** Shift it in on the low end, and see if there's
  377.         ** a byte ready for output.
  378.         */
  379.         leftchar = (leftchar << 6) | (this_ch);
  380.         leftbits += 6;
  381.         if ( leftbits >= 8 ) {
  382.             leftbits -= 8;
  383.             *bin_data++ = (leftchar >> leftbits) & 0xff;
  384.             leftchar &= ((1 << leftbits) - 1);
  385.             bin_len++;
  386.         }
  387.     }
  388.     /* Check that no bits are left */
  389.     if ( leftbits ) {
  390.         PyErr_SetString(Error, "Incorrect padding");
  391.         Py_DECREF(rv);
  392.         return NULL;
  393.     }
  394.     /* and remove any padding */
  395.     bin_len -= npad;
  396.     /* and set string size correctly */
  397.     _PyString_Resize(&rv, bin_len);
  398.     return rv;
  399. }
  400.  
  401. static char doc_b2a_base64[] = "(bin) -> ascii. Base64-code line of data";
  402.     
  403. static PyObject *
  404. binascii_b2a_base64(self, args)
  405.     PyObject *self;
  406.     PyObject *args;
  407. {
  408.     unsigned char *ascii_data, *bin_data;
  409.     int leftbits = 0;
  410.     unsigned char this_ch;
  411.     unsigned int leftchar = 0;
  412.     PyObject *rv;
  413.     int bin_len;
  414.     
  415.     if ( !PyArg_ParseTuple(args, "s#", &bin_data, &bin_len) )
  416.         return NULL;
  417.     if ( bin_len > BASE64_MAXBIN ) {
  418.         PyErr_SetString(Error, "Too much data for base64 line");
  419.         return NULL;
  420.     }
  421.     
  422.     /* We're lazy and allocate to much (fixed up later) */
  423.     if ( (rv=PyString_FromStringAndSize(NULL, bin_len*2)) == NULL )
  424.         return NULL;
  425.     ascii_data = (unsigned char *)PyString_AsString(rv);
  426.  
  427.     for( ; bin_len > 0 ; bin_len--, bin_data++ ) {
  428.         /* Shift the data into our buffer */
  429.         leftchar = (leftchar << 8) | *bin_data;
  430.         leftbits += 8;
  431.  
  432.         /* See if there are 6-bit groups ready */
  433.         while ( leftbits >= 6 ) {
  434.             this_ch = (leftchar >> (leftbits-6)) & 0x3f;
  435.             leftbits -= 6;
  436.             *ascii_data++ = table_b2a_base64[this_ch];
  437.         }
  438.     }
  439.     if ( leftbits == 2 ) {
  440.         *ascii_data++ = table_b2a_base64[(leftchar&3) << 4];
  441.         *ascii_data++ = BASE64_PAD;
  442.         *ascii_data++ = BASE64_PAD;
  443.     } else if ( leftbits == 4 ) {
  444.         *ascii_data++ = table_b2a_base64[(leftchar&0xf) << 2];
  445.         *ascii_data++ = BASE64_PAD;
  446.     } 
  447.     *ascii_data++ = '\n';    /* Append a courtesy newline */
  448.     
  449.     _PyString_Resize(&rv, (ascii_data - (unsigned char *)PyString_AsString(rv)));
  450.     return rv;
  451. }
  452.  
  453. static char doc_a2b_hqx[] = "ascii -> bin, done. Decode .hqx coding";
  454.  
  455. static PyObject *
  456. binascii_a2b_hqx(self, args)
  457.     PyObject *self;
  458.     PyObject *args;
  459. {
  460.     unsigned char *ascii_data, *bin_data;
  461.     int leftbits = 0;
  462.     unsigned char this_ch;
  463.     unsigned int leftchar = 0;
  464.     PyObject *rv;
  465.     int len;
  466.     int done = 0;
  467.     
  468.     if ( !PyArg_ParseTuple(args, "s#", &ascii_data, &len) )
  469.         return NULL;
  470.  
  471.     /* Allocate a string that is too big (fixed later) */
  472.     if ( (rv=PyString_FromStringAndSize(NULL, len)) == NULL )
  473.         return NULL;
  474.     bin_data = (unsigned char *)PyString_AsString(rv);
  475.  
  476.     for( ; len > 0 ; len--, ascii_data++ ) {
  477.         /* Get the byte and look it up */
  478.         this_ch = table_a2b_hqx[*ascii_data];
  479.         if ( this_ch == SKIP )
  480.             continue;
  481.         if ( this_ch == FAIL ) {
  482.             PyErr_SetString(Error, "Illegal char");
  483.             Py_DECREF(rv);
  484.             return NULL;
  485.         }
  486.         if ( this_ch == DONE ) {
  487.             /* The terminating colon */
  488.             done = 1;
  489.             break;
  490.         }
  491.  
  492.         /* Shift it into the buffer and see if any bytes are ready */
  493.         leftchar = (leftchar << 6) | (this_ch);
  494.         leftbits += 6;
  495.         if ( leftbits >= 8 ) {
  496.             leftbits -= 8;
  497.             *bin_data++ = (leftchar >> leftbits) & 0xff;
  498.             leftchar &= ((1 << leftbits) - 1);
  499.         }
  500.     }
  501.     
  502.     if ( leftbits && !done ) {
  503.         PyErr_SetString(Incomplete,
  504.                 "String has incomplete number of bytes");
  505.         Py_DECREF(rv);
  506.         return NULL;
  507.     }
  508.     _PyString_Resize(&rv, (bin_data - (unsigned char *)PyString_AsString(rv)));
  509.     if ( rv )
  510.         return Py_BuildValue("Oi", rv, done);
  511.     return NULL;
  512. }
  513.  
  514. static char doc_rlecode_hqx[] = "Binhex RLE-code binary data";
  515.  
  516. static PyObject *
  517. binascii_rlecode_hqx(self, args)
  518.     PyObject *self;
  519.     PyObject *args;
  520. {
  521.     unsigned char *in_data, *out_data;
  522.     PyObject *rv;
  523.     unsigned char ch;
  524.     int in, inend, len;
  525.     
  526.     if ( !PyArg_ParseTuple(args, "s#", &in_data, &len) )
  527.         return NULL;
  528.  
  529.     /* Worst case: output is twice as big as input (fixed later) */
  530.     if ( (rv=PyString_FromStringAndSize(NULL, len*2)) == NULL )
  531.         return NULL;
  532.     out_data = (unsigned char *)PyString_AsString(rv);
  533.     
  534.     for( in=0; in<len; in++) {
  535.         ch = in_data[in];
  536.         if ( ch == RUNCHAR ) {
  537.             /* RUNCHAR. Escape it. */
  538.             *out_data++ = RUNCHAR;
  539.             *out_data++ = 0;
  540.         } else {
  541.             /* Check how many following are the same */
  542.             for(inend=in+1;
  543.                 inend<len && in_data[inend] == ch &&
  544.                     inend < in+255;
  545.                 inend++) ;
  546.             if ( inend - in > 3 ) {
  547.                 /* More than 3 in a row. Output RLE. */
  548.                 *out_data++ = ch;
  549.                 *out_data++ = RUNCHAR;
  550.                 *out_data++ = inend-in;
  551.                 in = inend-1;
  552.             } else {
  553.                 /* Less than 3. Output the byte itself */
  554.                 *out_data++ = ch;
  555.             }
  556.         }
  557.     }
  558.     _PyString_Resize(&rv, (out_data - (unsigned char *)PyString_AsString(rv)));
  559.     return rv;
  560. }
  561.  
  562. static char doc_b2a_hqx[] = "Encode .hqx data";
  563.     
  564. static PyObject *
  565. binascii_b2a_hqx(self, args)
  566.     PyObject *self;
  567.     PyObject *args;
  568. {
  569.     unsigned char *ascii_data, *bin_data;
  570.     int leftbits = 0;
  571.     unsigned char this_ch;
  572.     unsigned int leftchar = 0;
  573.     PyObject *rv;
  574.     int len;
  575.     
  576.     if ( !PyArg_ParseTuple(args, "s#", &bin_data, &len) )
  577.         return NULL;
  578.  
  579.     /* Allocate a buffer that is at least large enough */
  580.     if ( (rv=PyString_FromStringAndSize(NULL, len*2)) == NULL )
  581.         return NULL;
  582.     ascii_data = (unsigned char *)PyString_AsString(rv);
  583.     
  584.     for( ; len > 0 ; len--, bin_data++ ) {
  585.         /* Shift into our buffer, and output any 6bits ready */
  586.         leftchar = (leftchar << 8) | *bin_data;
  587.         leftbits += 8;
  588.         while ( leftbits >= 6 ) {
  589.             this_ch = (leftchar >> (leftbits-6)) & 0x3f;
  590.             leftbits -= 6;
  591.             *ascii_data++ = table_b2a_hqx[this_ch];
  592.         }
  593.     }
  594.     /* Output a possible runt byte */
  595.     if ( leftbits ) {
  596.         leftchar <<= (6-leftbits);
  597.         *ascii_data++ = table_b2a_hqx[leftchar & 0x3f];
  598.     }
  599.     _PyString_Resize(&rv, (ascii_data - (unsigned char *)PyString_AsString(rv)));
  600.     return rv;
  601. }
  602.  
  603. static char doc_rledecode_hqx[] = "Decode hexbin RLE-coded string";
  604.     
  605. static PyObject *
  606. binascii_rledecode_hqx(self, args)
  607.     PyObject *self;
  608.     PyObject *args;
  609. {
  610.     unsigned char *in_data, *out_data;
  611.     unsigned char in_byte, in_repeat;
  612.     PyObject *rv;
  613.     int in_len, out_len, out_len_left;
  614.  
  615.     if ( !PyArg_ParseTuple(args, "s#", &in_data, &in_len) )
  616.         return NULL;
  617.  
  618.     /* Empty string is a special case */
  619.     if ( in_len == 0 )
  620.         return Py_BuildValue("s", "");
  621.  
  622.     /* Allocate a buffer of reasonable size. Resized when needed */
  623.     out_len = in_len*2;
  624.     if ( (rv=PyString_FromStringAndSize(NULL, out_len)) == NULL )
  625.         return NULL;
  626.     out_len_left = out_len;
  627.     out_data = (unsigned char *)PyString_AsString(rv);
  628.  
  629.     /*
  630.     ** We need two macros here to get/put bytes and handle
  631.     ** end-of-buffer for input and output strings.
  632.     */
  633. #define INBYTE(b) \
  634.     do { \
  635.     if ( --in_len < 0 ) { \
  636.         PyErr_SetString(Incomplete, ""); \
  637.             Py_DECREF(rv); \
  638.         return NULL; \
  639.     } \
  640.     b = *in_data++; \
  641.     } while(0)
  642.         
  643. #define OUTBYTE(b) \
  644.     do { \
  645.     if ( --out_len_left < 0 ) { \
  646.         _PyString_Resize(&rv, 2*out_len); \
  647.         if ( rv == NULL ) return NULL; \
  648.         out_data = (unsigned char *)PyString_AsString(rv) + out_len; \
  649.         out_len_left = out_len-1; \
  650.         out_len = out_len * 2; \
  651.     } \
  652.     *out_data++ = b; \
  653.     } while(0)
  654.  
  655.     /*
  656.     ** Handle first byte separately (since we have to get angry
  657.     ** in case of an orphaned RLE code).
  658.     */
  659.     INBYTE(in_byte);
  660.  
  661.     if (in_byte == RUNCHAR) {
  662.         INBYTE(in_repeat);
  663.         if (in_repeat != 0) {
  664.             /* Note Error, not Incomplete (which is at the end
  665.             ** of the string only). This is a programmer error.
  666.             */
  667.             PyErr_SetString(Error, "Orphaned RLE code at start");
  668.             Py_DECREF(rv);
  669.             return NULL;
  670.         }
  671.         OUTBYTE(RUNCHAR);
  672.     } else {
  673.         OUTBYTE(in_byte);
  674.     }
  675.     
  676.     while( in_len > 0 ) {
  677.         INBYTE(in_byte);
  678.  
  679.         if (in_byte == RUNCHAR) {
  680.             INBYTE(in_repeat);
  681.             if ( in_repeat == 0 ) {
  682.                 /* Just an escaped RUNCHAR value */
  683.                 OUTBYTE(RUNCHAR);
  684.             } else {
  685.                 /* Pick up value and output a sequence of it */
  686.                 in_byte = out_data[-1];
  687.                 while ( --in_repeat > 0 )
  688.                     OUTBYTE(in_byte);
  689.             }
  690.         } else {
  691.             /* Normal byte */
  692.             OUTBYTE(in_byte);
  693.         }
  694.     }
  695.     _PyString_Resize(&rv, (out_data - (unsigned char *)PyString_AsString(rv)));
  696.     return rv;
  697. }
  698.  
  699. static char doc_crc_hqx[] = "(data, oldcrc) -> newcrc. Compute hqx CRC incrementally";
  700.  
  701. static PyObject *
  702. binascii_crc_hqx(self, args)
  703.     PyObject *self;
  704.     PyObject *args;
  705. {
  706.     unsigned char *bin_data;
  707.     unsigned int crc;
  708.     int len;
  709.     
  710.     if ( !PyArg_ParseTuple(args, "s#i", &bin_data, &len, &crc) )
  711.         return NULL;
  712.  
  713.     while(len--) {
  714.         crc=((crc<<8)&0xff00)^crctab_hqx[((crc>>8)&0xff)^*bin_data++];
  715.     }
  716.  
  717.     return Py_BuildValue("i", crc);
  718. }
  719.  
  720. /* List of functions defined in the module */
  721.  
  722. static struct PyMethodDef binascii_module_methods[] = {
  723.     {"a2b_uu",        binascii_a2b_uu,    1,    doc_a2b_uu},
  724.     {"b2a_uu",        binascii_b2a_uu,    1,    doc_b2a_uu},
  725.     {"a2b_base64",        binascii_a2b_base64,    1,
  726.          doc_a2b_base64},
  727.     {"b2a_base64",        binascii_b2a_base64,    1,
  728.          doc_b2a_base64},
  729.     {"a2b_hqx",        binascii_a2b_hqx,    1,    doc_a2b_hqx},
  730.     {"b2a_hqx",        binascii_b2a_hqx,    1,    doc_b2a_hqx},
  731.     {"rlecode_hqx",        binascii_rlecode_hqx,    1,
  732.          doc_rlecode_hqx},
  733.     {"rledecode_hqx",    binascii_rledecode_hqx,    1,
  734.          doc_rledecode_hqx},
  735.     {"crc_hqx",        binascii_crc_hqx,    1,    doc_crc_hqx},
  736.     {NULL,            NULL}        /* sentinel */
  737. };
  738.  
  739.  
  740. /* Initialization function for the module (*must* be called initbinascii) */
  741. static char doc_binascii[] = "Conversion between binary data and ASCII";
  742.  
  743. void
  744. initbinascii()
  745. {
  746.     PyObject *m, *d, *x;
  747.  
  748.     /* Create the module and add the functions */
  749.     m = Py_InitModule("binascii", binascii_module_methods);
  750.  
  751.     d = PyModule_GetDict(m);
  752.     x = PyString_FromString(doc_binascii);
  753.     PyDict_SetItemString(d, "__doc__", x);
  754.  
  755.     Error = PyString_FromString("binascii.Error");
  756.     PyDict_SetItemString(d, "Error", Error);
  757.     Incomplete = PyString_FromString("binascii.Incomplete");
  758.     PyDict_SetItemString(d, "Incomplete", Incomplete);
  759.  
  760.     /* Check for errors */
  761.     if (PyErr_Occurred())
  762.         Py_FatalError("can't initialize module binascii");
  763. }
  764.